基于机器学习的血浆代谢组学改善肝硬化风险分层
Machine learning-based plasma metabolomics for improved cirrhosis risk stratification
探讨基于机器学习的血浆代谢组学在改善肝硬化风险分层中的作用,通过将代谢组学数据与天门冬氨酸转氨酶与血小板比值指数(APRI)和纤维化 - 4 评分(FIB-4)相结合,构建肝硬化风险预测模型。
思考:用自己数据+BMI、性别分组预测等提高预测准确度
摘要
背景 肝硬化是慢性肝病(CLD)患者死亡的主要原因。
方法 本研究使用英国生物银行(UKB)的质子核磁共振(1H-NMR)血清代谢组学数据,采用弹性网正则化的Cox比例风险模型,探讨代谢组学在慢性肝病(CLD)患者肝硬化风险分层中的作用。将代谢组学数据与天门冬氨酸转氨酶与血小板比值指数(APRI)和纤维化-4评分(FIB-4)相结合,构建肝硬化风险预测模型,并在推导队列和验证队列中评估模型性能。
结果 本研究共纳入2738名符合条件的患者进行分析。多种代谢物与肝硬化事件存在独立关联(调整年龄和性别后,168种代谢物中有68种;全面调整后,168种代谢物中有21种)。与单独使用FIB-4相比,代谢组学与FIB-4的整合提高了预测性能(Harrell's C指数:0.717 vs. 0.696,ΔC=0.021,95%置信区间[CI] 0.014-0.028,净重新分类改善指数[NRI]:0.504 [0.488–0.520])。同样,与单独使用APRI相比,代谢组学与APRI的结合也改善了预测性能(Harrell's C指数:0.747 vs. 0.718,ΔC=0.029,95%置信区间0.022-0.035,净重新分类改善指数:0.378 [0.366–0.389])。已确定的重要预测因子包括支链氨基酸(BCAAs)、脂质和氧化应激标志物。通路富集分析显示,脂质和氨基酸代谢紊乱在肝硬化进展中起核心作用。
结论 质子核磁共振(1H-NMR)血清代谢组学显著提高了对慢性肝病(CLD)患者肝硬化风险的预测能力。天门冬氨酸转氨酶与血小板比值指数(APRI)+代谢组学模型具有很强的鉴别能力,其关键代谢物涉及脂肪酸和氨基酸代谢,为肝硬化风险的早期筛查提供了一种有前景的工具。
介绍
肝硬化是全球第11大常见死因,每年导致超过100万人死亡[1]。肝硬化的主要病因是慢性肝病(CLD),包括病毒感染、酒精性肝病(ALD)、代谢相关脂肪性肝病(MAFLD,也称为非酒精性脂肪性肝病[NAFLD])、自身免疫性肝病、慢性胆汁淤积以及药物相关或中毒性肝损伤。慢性肝病的进展过程是从肝纤维化发展为肝硬化。大多数肝硬化患者有单一的潜在病因,但也有少数患者存在多种致病因素[2]。慢性肝病通常在终末期发展为肝硬化。慢性肝病通过代谢失调进展为不可逆的肝硬化,导致脂肪堆积、炎症和纤维化,逐渐损害肝脏的结构和功能[1]。肝硬化的进展需要数年时间,由于慢性肝病患者存在个体差异,预测肝硬化的进展及其并发症仍然具有挑战性[3]。
当前的研究主要集中在肝硬化的诊断上,很少有研究涉及慢性肝病(CLD)患者的肝硬化风险分层。以往的研究已经探索了用于预测此类患者肝硬化的风险评分,但这些研究往往受限于所研究的肝病类型[4,5]或样本量较小[6]。尽管肝活检仍是诊断和分期肝纤维化的金标准,但其有创性及相关风险限制了其在肝纤维化进展的纵向监测或治疗反应评估中的适用性[7]。天门冬氨酸转氨酶与血小板比值指数(APRI)和纤维化-4(FIB-4)指数等血清标志物常被用于预测肝硬化,但其敏感性和特异性仍不理想[8]。慢性肝病的管理具有挑战性,需要更可靠的方法来评估这些患者的肝硬化进展风险。尽早识别慢性肝病患者进展为肝硬化的风险,有助于增加监测频率、实施预防措施并减轻治疗负担。
肝脏是新陈代谢的核心调节器官。游离脂肪酸增加、高血糖、脂毒性以及细胞激活后蛋白质合成的显著改变,都会破坏肝脏结构,促进肝纤维化的发展,最终导致肝硬化[9]。肝脏持续的代谢功能障碍会引发慢性线粒体损伤和慢性肝病(CLD),并最终进展为终末期肝病[10]。
代谢组学这一快速发展的领域已成为临床研究中的强大工具,有助于生物标志物的识别、表型分析、疾病分期以及潜在机制的揭示[11]。众所周知,代谢物与慢性肝病(CLD)向肝硬化的进展有关[9]。基于质子核磁共振(1H-NMR)光谱的血清样本代谢组学是一种研究多参数代谢变化及反应的定量方法,已广泛应用于肝病研究[12,13]。然而,血清代谢组学在预测CLD向肝硬化进展方面的潜力尚未得到系统评估和基准测试。
英国生物银行(UKB)是一项大型前瞻性队列研究,在2006年至2010年间招募了50多万名参与者[14]。英国生物银行的参与者接受了全面的表型特征分析,其健康记录随后被记录在案。研究人员使用1H-NMR对大约12万份基线血清样本进行了大规模代谢组学分析,涵盖168种独立代谢物。在本研究中,我们利用英国生物银行的资源,将代谢组学数据与机器学习相结合,以加强对慢性肝病(CLD)患者肝硬化的风险分层。
方法
Study design
参与者接受了全面的基线评估,包括收集临床信息和生物样本,并进行定期更新和随访[15]。基线时收集了血液、尿液和唾液样本用于分析。
2019年6月至2020年4月期间,使用夜莺健康有限公司(Nightingale Health Ltd.)开发的高通量核磁共振(NMR)代谢组学平台,从118,019份基线乙二胺四乙酸(EDTA)非空腹静脉血清样本中获取了代谢生物标志物。详细信息可参见英国生物银行(UKB)的研究文档(https://biobank.ctsu.ox.ac.uk/ukb/ukb/docs/nmrm_companion_doc)。在控制质量和批次效应后,获得了249种代谢生物标志物(168种原始测量值和81种比值)。
我们根据168种主要代谢物的直接浓度和生物学相关性对其进行了筛选,因为这些生物标志物在预测疾病风险方面的实用性及其与临床结局的强相关性已得到广泛认可[16]。其余81项指标(包括代谢物比值、单个代谢物在其总类别中的百分比以及不饱和度测量值)被排除在外,以专注于特定代谢物的绝对浓度[17]。
我们重点关注了168项代表各种代谢物浓度的测量结果,这些代谢物被分为17组。其中包括:氨基酸1(n=10)、载脂蛋白(n=2)、胆固醇(n=21)、胆固醇酯(n=18)、脂肪酸(n=9)、液体平衡(n=2)、游离胆固醇(n=18)、糖酵解相关代谢物(n=4)、炎症(n=1)、酮体(n=4)、脂蛋白颗粒浓度(n=4)、脂蛋白颗粒大小(n=3)、脂蛋白颗粒(n=14)、其他脂质(n=4)、磷脂(n=18)、总脂质(n=18)和甘油三酯(n=18)。
在本研究中,我们纳入了所有在初始评估中心访视时完成168项原始血清代谢物测量的英国生物银行(UKB)参与者的完整数据。我们进一步排除了参数不完整的个体,例如年龄或肝酶数据缺失者、基线诊断为肝硬化者,以及代谢组学测量值显著异常(定义为超出平均值5个标准差)者。排除年龄和肝酶等关键参数缺失的个体是为了确保分析的完整性和准确性。最终模型仅使用完整的数据集,以避免潜在偏倚并确保结果稳健可靠。为了排除降脂药物对代谢组学特征的影响,服用这些药物的参与者也被排除在外。经过上述筛选,共留下2738名符合条件的慢性肝病(CLD)患者用于分析,使我们能够探索血清代谢组学与CLD进展之间的关联。 该队列随后被分为推导队列(80%)和验证队列(20%)。选择这种方法是为了保留样本中的异质性,确保模型对更广泛人群具有可推广性。由于样本量相对有限,分层抽样可能导致某些亚组样本量不足,从而可能影响模型的稳定性。此外,随机抽样有助于模拟更多样化的真实人群,同时最大限度地减少因过于复杂的分层过程可能产生的潜在偏倚。我们使用推导子集训练弹性网(EN)模型来预测肝硬化风险,随后在验证子集中对模型进行验证(图1)。
Definition of CLD and cirrhosis
我们将起点定义为慢性肝病(CLD),终点定义为肝硬化[15],两者均通过从医院电子健康记录中获取的临床诊断确定,或在与该疾病相关的死亡或手术病例中确定。基线时被诊断为肝纤维化或肝硬化的个体被排除在本研究之外。补充表1提供了详细的疾病代码和定义。本研究中使用的疾病和预测因子的详细定义可参见补充表2。
肝硬化风险模型与预测因子提取
我们从英国生物银行(UKB)数据集中提取了与肝硬化相关的预测因子[15]。补充表2详细描述了所有相关的数据字段、疾病及相关信息。肝纤维化严重程度的独立预测因子包括年龄、男性、肥胖、高血压、糖尿病、丙氨酸转氨酶(ALT)升高、天门冬氨酸转氨酶(AST)升高、血小板计数(PLT)降低、白蛋白(Alb)降低,以及超声检查显示的脂肪肝和肝脂肪变性[18]。
纳入研究时,我们首先检测了每种代谢物与肝硬化事件之间的关联,并确定了一系列显著相关的代谢物。在风险预测方面,我们将多种因素纳入风险评估,包括社会人口统计学因素(年龄、性别)、患者病史(吸烟、饮酒、睡眠模式)、体格测量指标(体重指数[BMI]、收缩压、血压、血糖)以及临床化学标志物(肝酶、白蛋白和其他相关指标)。分析框架中考虑了潜在的混杂因素,包括饮酒、药物使用和饮食习惯。饮酒情况通过英国生物银行问卷中自我报告的饮酒频率和强度数据进行调整。对于药物使用,我们排除了服用已知会影响代谢谱的降脂药物的个体。尽管没有详细的饮食信息,但分析中纳入的代谢物间接反映了营养状况和饮食模式。收缩压记录两次,取较低的读数。如果自动测量出现误差,则记录手动读数。
我们共使用了五种模型,基础模型为“代谢组学”模型,该模型侧重于代谢组学的特异性。
为预测肝硬化风险,我们采用了FIB-4和APRI模型,这两种模型均广泛用于评估慢性肝病(CLD)患者发生肝硬化的风险。FIB-4模型包含四个参数:年龄、血小板计数(PLT)、丙氨酸转氨酶(ALT)和天门冬氨酸转氨酶(AST)水平。APRI模型基于ALT与AST的比值以及血小板计数。
我们通过将代谢组学数据与常用的APRI和FIB-4模型相结合,进一步开发了APRI+代谢组学模型和FIB-4+代谢组学模型,以评估添加代谢组学数据是否能改善模型性能。
Survival analysis of individual metabolite associations
所有代谢物均经过对数归一化处理,并标准化为均值0、标准差1,以减少偏度、确保不同代谢物之间的可比性,同时消除因原始尺度差异带来的偏倚,从而提高模型的稳健性和可解释性。采用Cox比例风险(Cox-PH)模型评估每种代谢物与肝硬化风险的关联。该模型校正了年龄、性别以及一整套慢性肝病(CLD)风险因素。采用Benjamini-Hochberg法对P值进行多重比较校正。
Elastic net model development and evaluation
为确定最具预测性的代谢物,我们在训练集中应用了带有弹性网(EN)正则化的Cox比例风险(Cox-PH)模型,通过10折交叉验证优化模型的鉴别能力,并用Harrell's C指数评估模型性能。弹性网正则化结合了L1正则化(套索)和L2正则化(岭回归)的优势,通过调整α参数(0≤α≤1)来平衡模型的稀疏性和复杂性,该参数控制着L1正则化与L2正则化之间的权重比例。L1部分有助于变量筛选,而L2部分则能增强模型的稳定性。我们通过10折交叉验证对模型性能进行优化,以确定最佳的α和λ(正则化强度)参数,从而最大化Cox模型的鉴别能力(如Harrell's C指数)并最小化过拟合。 在验证集中,我们使用Harrell's C指数、敏感性、约登指数、特异性和净重新分类改善指数(NRI)等指标评估最终模型的预测准确性。此外,我们还进行了受试者工作特征(ROC)曲线分析和决策曲线分析,并根据预测的肝硬化风险将个体分为五等分组。通过校准和网络可视化,进一步验证了模型的性能。
L1正则化(套索)的主要作用是促进变量筛选,它会将一些变量的系数压缩至0,从而在模型中剔除这些变量,有助于简化模型并突出关键因素。L2正则化(岭回归)则侧重于增强模型的稳定性,通过对系数进行惩罚,避免系数过大,减少模型对某些变量的过度依赖,降低过拟合风险。 在弹性网(EN)正则化中,结合了L1和L2正则化的优势,通过调整α参数(0≤α≤1)来平衡两者的权重比例,以此平衡模型的稀疏性和复杂性,既实现了变量的有效选择,又保证了模型的稳定性。
我们使用corrplot包计算并可视化了模型特征的斯皮尔曼相关性。
网络可视化遵循标准的加权基因共表达网络分析(WGCNA)流程,其中计算了代谢物相关性,并将其转换为邻接矩阵,软阈值设为β=30。使用硬阈值(阈值=0.2)处理得到的拓扑重叠矩阵,以构建非加权网络图。最终APRI+代谢组学模型中包含的代谢物节点用饱和色突出显示,节点大小根据连接度进行调整。整个网络使用WGCNA和igraph包生成并可视化。
关键代谢物的识别与通路富集分析
通过弹性网(EN)Cox回归从模型中识别出关键代谢物。最终模型中系数非零的代谢物被视为关键代谢物,并根据其系数大小对其重要性进行排序。
为进一步阐明这些代谢物所参与的生物学通路,我们使用WebGestalt工具(https://www.webgestalt.org)进行了通路富集分析。利用京都基因与基因组百科全书(KEGG)数据库,将关键代谢物映射到其对应的通路中。
Significance, software, and data availability
所有分析均使用R软件(v.4.3.3版本)进行。采用Benjamini-Hochberg方法控制统计显著性,将校正后的P值小于0.05定义为具有显著性。这些数据可在英国生物银行(UKB)网站上获取。
结果
Baseline characteristics
按照严格的筛选标准,最终的研究队列纳入了2738名慢性肝病(CLD)患者(表1)。符合条件的参与者中位年龄为56岁(四分位距:50-62岁),其中51.4%为男性。在研究期间,发生肝硬化的个体(n=142[5.2%])往往年龄更大。基线特征和事件发生率存在显著差异,尤其是在各种社会人口统计学因素方面,如汤森剥夺指数(TDI)和饮酒频率。汤森剥夺指数评分较高的参与者更有可能进展为肝硬化。社会经济地位较低和社会劣势较明显与肝硬化相关(P=0.002)。饮酒频率也与肝硬化相关,饮酒越频繁,肝硬化的发生率越高(P<0.001)。临床化学指标,如丙氨酸转氨酶(ALT)、天门冬氨酸转氨酶(AST)、碱性磷酸酶(ALP)、血小板计数(PLT)、白蛋白(Alb)、总胆红素(TBil)、直接胆红素(DBil),以及常用评分(如APRI和FIB-4),均与肝硬化显著相关。这些发现与基于文献的预期一致[19-21]。
单个代谢物与肝硬化的关系
为探究单个代谢物与肝硬化风险之间的关系,我们采用Cox比例风险模型评估了这些代谢物与慢性肝病(CLD)进展为肝硬化之间的关联。在对年龄和性别进行校正后,168种代谢物中有68种(40.5%)被发现与肝硬化事件显著相关。然而,在进一步校正所有特征后,显著相关的代谢物数量减少至21种(12.5%)。值得注意的是,仅有10种代谢物(5.9%)在两个模型中均表现出一致的显著性(所有代谢物的详细统计结果见补充表S3和S4)。
在校正年龄和性别的模型中(图2A和图3A),我们观察到大多数脂蛋白颗粒、甘油三酯(极低密度脂蛋白[VLDL])、磷脂(极低密度脂蛋白、低密度脂蛋白[LDL]和高密度脂蛋白[HDL])以及总脂质(极低密度脂蛋白和高密度脂蛋白颗粒)与肝硬化事件呈正相关,而其他代谢物(如某些氨基酸和游离胆固醇)则呈负相关。
图2 基于血清代谢组学和临床数据的肝硬化风险分层Cox比例风险模型结果。(A)针对每种代谢物校正年龄和性别的Cox比例风险模型;(B)包含所有特征的Cox比例风险模型。部分代谢物与肝硬化事件显著相关,经错误发现率控制后的p值<0.05(以深灰色标签标示)。条形图的颜色代表关联方向:红色表示正相关,蓝色表示负相关。
在进一步校正年龄、性别、生活方式因素和生化检测指标后(图2B和图3B),磷脂、氨基酸、游离胆固醇和总脂质的关联强度有所降低。然而,与脂蛋白颗粒的关联性则变得更强,这表明即使在校正了体重指数(BMI)、肝功能检查、吸烟和饮酒等因素后,这些代谢物仍与肝硬化存在显著相关性。
在两项Cox比例风险模型分析中,共识别出10种重叠的代谢物。这些代谢物主要分布在以下类别中:脂蛋白颗粒大小、脂蛋白颗粒浓度、胆固醇酯、磷脂和总脂质。值得注意的是,这些代谢物的风险比(HRs)在两个模型中均表现出一致的关联性,表明它们可能与肝硬化的发生发展存在显著关联。这些发现提示,某些代谢物或许可作为慢性肝病(CLD)患者肝硬化风险的潜在生物标志物。补充表S3和S4提供了单个代谢物分析的详细结果,凸显了这些关联的复杂性和特异性。
血清代谢组学在肝硬化风险分层中的应用
我们的数据集被分为衍生队列(80%)和验证队列(20%),两组的基线特征和肝硬化结局保持良好平衡(补充表S5)。在衍生队列中,我们拟合了弹性网正则化风险模型。这五个模型包括:仅代谢组学模型(168种代谢物中的36种)、FIB-4模型、APRI模型、FIB-4+代谢组学模型(168种代谢物中的18种)以及APRI+代谢组学模型(168种代谢物中的22种)(特征系数和优化后的模型超参数详见补充表S6和S7)。
为探究单个代谢物与肝硬化风险之间的关系,我们采用Cox比例风险模型评估了这些代谢物与慢性肝病(CLD)进展为肝硬化之间的关联。
而图4A展示了五个模型的ROC曲线,其中仅代谢组学模型、FIB-4模型的AUC分别为0.696、0.696,APRI模型的AUC为0.712。将FIB-4与代谢组学数据相结合的FIB-4+代谢组学模型,AUC达到0.717,其鉴别能力优于单独使用FIB-4模型或仅代谢组学模型。APRI+代谢组学模型的AUC最高,为0.747,是所有模型中鉴别能力最强的。 这些结果表明,在评估肝硬化风险方面,结合代谢组学数据的模型(尤其是APRI+代谢组学模型)相较于单独的传统模型(FIB-4、APRI)或仅代谢组学模型,能更有效地识别肝硬化风险,这也从侧面反映出代谢物与肝硬化风险存在关联,将其纳入风险评估模型可提升对肝硬化风险的鉴别效能。
图4 模型内部验证:不同模型的鉴别性能。(A)ROC曲线展示了不同模型在鉴别肝硬化风险中的表现。(B)决策曲线分析(DCA)曲线显示了每个模型在预测肝硬化事件中的临床实用性。
其核心是通过计算不同阈值概率下模型的净临床获益,来衡量模型在实际临床决策中的价值。
文章中虽未详细说明决策曲线分析(DCA)的具体计算步骤,但基于DCA的通用原理和临床研究中的常规方法,其核心计算逻辑可概括如下: ### DCA曲线的核心计算逻辑 DCA通过比较不同阈值概率下模型的净获益(Net Benefit) 来评估临床实用性,具体步骤如下:
- 定义阈值概率(Threshold Probability) 横轴为“阈值概率”(即临床医生认为值得采取干预措施的风险阈值),范围通常为0~1。例如,若阈值设为5%,则仅对预测肝硬化风险≥5%的患者进行干预。
- 计算净获益(Net Benefit) 对于每个阈值概率,净获益的计算公式为:
- 真阳性(TP):模型预测为“高风险”且实际发生肝硬化的患者;
- 假阳性(FP):模型预测为“高风险”但实际未发生肝硬化的患者;
- 公式中第二项代表“干预假阳性患者的代价”,通过阈值概率调节(阈值越高,对假阳性的容忍度越低)。
- 对比基准策略 DCA会同时计算两种极端策略的净获益作为参照:
- “对所有人干预”:此时真阳性=实际事件数,假阳性=总人数-实际事件数;
- “对所有人不干预”:净获益恒为0。 若模型的净获益高于这两种策略,则说明其具有临床实用价值。
- 绘制曲线 纵轴为“净获益”,横轴为“阈值概率”,将不同阈值下的净获益连接成线,即得到DCA曲线。曲线越高,说明模型在该阈值范围内的临床价值越高。 ### 文章中DCA的应用 文中通过DCA曲线(图4B)比较了5种模型(仅代谢组学、FIB-4、APRI、FIB-4+代谢组学、APRI+代谢组学)的净获益,结论显示: - 纳入代谢组学数据的模型(尤其是APRI+代谢组学)在大多数阈值下净获益更高,说明其在指导临床决策(如是否对患者进行进一步检查或干预)时,能更好地平衡获益与风险,具有更高的实用价值。 这一分析补充了ROC曲线(仅反映鉴别能力)的不足,从“临床实际应用价值”角度验证了模型的优越性。
图4B展示了不同阈值概率下各模型的净临床获益。净获益用于衡量模型在不同阈值范围内的潜在临床价值。在大多数阈值下,纳入代谢组学数据的模型优于仅使用传统参数的模型,表现出更高的净获益。其中,APRI+代谢组学模型在几乎所有阈值下均显示出最高的净获益,这表明该模型具有潜在的临床应用价值。
表2提供了用于评估绝对鉴别能力的模型内部验证统计数据。APRI+代谢组学模型的C指数最高(0.747),表明其在预测患者肝硬化方面的能力最强。C统计量差值(ΔC)代表不同模型之间C指数的差异,用于评估纳入代谢组学数据后模型性能的提升情况。根据我们的结果……
结合研究中采用Cox比例风险模型探究单个代谢物与肝硬化风险关系的基础,为进一步评估模型分类性能的提升程度,我们对模型进行了成对比较(表3),涉及FIB-4与APRI、仅代谢组学模型与FIB-4+代谢组学模型、仅代谢组学模型与APRI+代谢组学模型、FIB-4与FIB-4+代谢组学模型、APRI与APRI+代谢组学模型以及FIB-4+代谢组学模型与APRI+代谢组学模型。
表3 模型内部验证:不同模型在肝硬化风险分层中的相对性能指标
该表比较了不同模型在肝硬化风险分层中的相对性能。模型性能在验证队列中进行评估。95%置信区间(括号内)来自验证队列中1000次bootstrap重抽样的百分位数分布。 缩写:ΔC,C统计量差值;NRI,净重新分类指数;APRI,天门冬氨酸转氨酶与血小板比值指数;FIB-4,纤维化-4评分。
该表格通过ΔC(C统计量差值)和NRI(净重新分类指数)两个指标,对比了不同模型在肝硬化风险分层中的相对性能,具体解释如下:
### 核心指标说明
- ΔC(C统计量差值):表示两个模型C指数的差异,数值为正且越大,说明前者(横线前的模型)相比后者(横线后的模型)的鉴别能力越弱,即后者性能更优;反之则前者更优。
- NRI(净重新分类指数):分为“Cases(病例,即实际发生肝硬化的患者)”“Non-cases(非病例,即未发生肝硬化的患者)”和“Overall(总体)”三部分,用于衡量模型对个体风险分类的改进: - 正值表示模型在该类别中分类更准确;负值表示分类准确性下降。 - 总体NRI为正且越大,说明模型整体分类改进越显著。
后续的性能评估表明,纳入代谢组学数据后模型的鉴别能力得到提升。例如,与单独使用FIB-4模型相比,FIB-4+代谢组学模型的C指数增加了0.021[0.014–0.028],净重新分类指数(NRI)为0.504[0.488-0.520]。同样,与单独使用APRI模型相比,APRI+代谢组学模型的C指数提升了0.029[0.022–0.035],NRI为0.378[0.366–0.389]。这些发现表明,添加代谢组学数据有助于增强模型的分类效果。不过,APRI+代谢组学模型的NRI显示,其在病例分类方面有显著改善,但在非病例分类上NRI为负值,这意味着部分低风险个体可能被误分类为高风险。内部验证指标的结果汇总于补充表8,相对性能指标详见补充表9。 这一结果与Cox比例风险模型所揭示的代谢物与肝硬化风险存在关联的结论相呼应,进一步证实了将通过该模型识别出的相关代谢物整合到传统模型中,能够切实提升模型对肝硬化风险的分类效能,为临床风险评估提供了更优的工具。
总体而言,APRI+代谢组学模型在鉴别能力(C指数)和临床净获益方面均表现出更优的性能,使其在风险分类和肝硬化进展预测中更为有效。
代谢组学与肝硬化风险分层
为进一步探究这些风险模型的转化应用潜力,我们基于预测风险评估了肝硬化的累积发病率、模型校准度以及无肝硬化生存率。在FIB-4和APRI模型中纳入血清代谢组学数据后,在肝硬化发病率的五分位数分组中,风险分层效果得到了改善(图5A)。
图5 代谢组学可增强肝硬化的风险分层和生存分层。(A)按风险五分位数划分的肝硬化累积发病率,蓝色阴影表示不同风险水平的分层。(B)模型校准图显示观察到的与预测的肝硬化事件风险,有助于了解模型预测肝硬化事件的准确性。(C)按风险五分位数划分的无肝硬化生存率,展示了风险类别与无肝硬化进展生存率之间的关系。
我们对所有完成10年随访的个体进行了模型校准度评估,发现除仅含代谢组学的模型准确性较低外,其余所有模型的校准效果均良好且相近(图5B)。
最后,Kaplan-Meier曲线显示,在整个随访期间,纳入代谢组学数据的模型(尤其是FIB-4+代谢组学模型和APRI+代谢组学模型)在生存分层方面表现更优(图5C),且P<0.05。
模型选择与特征保留
减少测量的特征数量对于具有成本效益的临床应用和预防性筛查至关重要。在我们的研究中,我们使用弹性网络(EN)正则化的Cox回归模型来筛选携带最具预测价值信息的特征。图6A展示了这种方法 #? ,其中代谢物的网络可视化突出了单个代谢物对高度关联聚类的有效表征。最终模型保留了若干不相关的代谢物特征(图6B)。总共保留了17种代谢物,包括6种氨基酸、2种脂肪酸和9种脂蛋白亚类(所有临床和代谢物特征系数见补充表S6 )。对所测代谢物的网络可视化显示,单个代谢物可有效代表高度相关的聚类 。
研究采用弹性网络(EN)正则化Cox回归模型来筛选携带最多预测信息的特征。 图6A展示了这一方法,其中代谢物的网络可视化结果突出显示,单个代谢物能够有效代表高度连通的聚类。最终模型保留了若干不相关的代谢物特征(图6B),共筛选出17种代谢物,包括6种氨基酸、2种脂肪酸和9种脂蛋白亚类(所有临床和代谢物特征系数详见补充表S6)。
所测代谢物的网络可视化表明,个体代谢物可有效代表高度相关的聚类,这意味着通过该筛选方法保留的关键代谢物既能精简特征数量、降低成本,又能较好地保留与肝硬化风险相关的预测信息,为后续模型的临床应用奠定了实用基础。这一过程与前期通过Cox比例风险模型识别出的代谢物与肝硬化风险的关联相呼应,进一步从预测效能和实用性结合的角度,确定了用于构建风险模型的核心代谢物特征。
图6 代表肝硬化代谢风险的关键特征。(A)APRI+代谢组学模型的相关性热图,展示了临床特征与代谢物特征之间的关系。该热图突出显示了所选临床参数与代谢物之间的显著相关性,有助于了解这些特征在肝硬化风险预测中的作用。(B)所测代谢组学的网络可视化图,展示了保留的关键临床特征和代谢物特征。该网络图呈现了临床特征与代谢物特征之间的相互联系,使人们能更清晰地理解它们在代谢风险中的联合作用。
已识别的关键代谢物及通路富集分析
APRI+代谢组学模型识别出21种关键代谢物,它们分属多个功能类别,是肝硬化风险的重要预测因子。
其中,氨基酸(包括支链氨基酸——缬氨酸、亮氨酸、异亮氨酸,以及谷氨酰胺、甘氨酸)与肝硬化呈负相关,这表明它们在维持蛋白质合成和氮平衡方面发挥着作用。相反,苯丙氨酸和酪氨酸与肝硬化呈正相关,反映出肝功能障碍和代谢应激状态。
脂肪酸(如二十二碳六烯酸(DHA)和单不饱和脂肪酸(MUFAs))提示脂质代谢和炎症存在显著紊乱,而这正是肝硬化进展的关键驱动因素。
胆固醇和脂蛋白标志物(包括低密度脂蛋白胆固醇、极低密度脂蛋白胆固醇、总胆固醇减去高密度脂蛋白胆固醇)反映出脂质超载和肝细胞损伤;同时,大颗粒极低密度脂蛋白和超大颗粒高密度脂蛋白中磷脂及总脂质的变化,提示膜不稳定性和代谢失调。小颗粒极低密度脂蛋白中的游离胆固醇进一步表明氧化应激也是一个促成因素。
在这些代谢物中,DHA、单不饱和脂肪酸和大颗粒极低密度脂蛋白中的总脂质影响最为显著,凸显了脂质代谢紊乱在肝硬化发病机制中的关键作用。
==代谢通路富集分析(图7)==确定了肝硬化进展过程中多个受干扰的通路,突显了它们在该疾病中的生物学相关性。最显著富集的通路是苯丙氨酸和酪氨酸代谢,突出了其在氮失衡以及肝脏清除能力受损(均为晚期肝病的标志性特征 )中的核心作用。其他显著富集的通路包括卟啉代谢(与血红素生物合成紊乱和氧化应激相关 )以及氮代谢(反映尿素循环功能障碍和氨解毒能力受损 )。缬氨酸、亮氨酸和异亮氨酸的降解(代表支链氨基酸分解代谢 )也明显富集,提示蛋白质代谢受损和能量产生减少。在视黄醇代谢、磷脂酰肌醇磷酸代谢和氨基糖代谢等通路中也观察到了额外的富集情况,表明脂质信号传导、维生素代谢和碳水化合物利用存在更广泛的改变。精氨酸和脯氨酸代谢通路以及嘌呤代谢通路进一步突显了肝硬化特有的广泛代谢重编程特征 。
讨论
肝硬化是全球慢性肝病(CLD)患者发病和死亡的主要原因,预计未来十年与肝硬化相关的死亡人数将有所增加[22]。因此,需要加大力度推动一级预防、肝硬化的早期检测以及改善治疗可及性。投入更多资源用于一级预防、肝硬化的早期诊断以及更好地与医疗服务相结合,对于减轻全球肝硬化负担至关重要[20]。识别出肝硬化高发风险人群,对于降低肝病相关死亡率具有重要意义。
由于肥胖患病率上升、酒精消费量增加以及乙型和丙型肝炎感染管理的改善,肝硬化的病因正在发生变化[20]。这些因素改变了肝硬化的流行病学特征和疾病负担。以往的模型往往聚焦于单一疾病病因,无法很好地应对慢性肝病(CLD)不断演变的疾病谱。当多种肝病同时存在时,这些模型的表现往往欠佳。因此,迫切需要一种适用于所有类型慢性肝病的工具,该工具应具备更高的诊断准确性,以识别存在疾病进展风险的个体。在高危人群出现临床症状前进行早期干预,有可能逆转早期肝纤维化。
在本研究中,我们阐述了单个代谢物与肝硬化事件之间的关联,这与先前报道的研究结果及已确立的病理机制一致。涉及氨基酸、脂质、碳水化合物和脂肪酸的代谢功能障碍不断累积,会导致氧化应激和肝细胞损伤,推动慢性肝病(CLD)向更严重的病理阶段发展[23]。 由于肝脏是氨基酸代谢的主要器官,肝功能受损会导致氨基酸代谢发生改变。以往研究表明,早期肝硬化会引起外周血氨基酸失衡,其特征是支链氨基酸(BCAAs)减少,而苯丙氨酸、酪氨酸等芳香族氨基酸(AAAs)增加,这是由于肝脏清除功能受损所致[24]。苯丙氨酸和酪氨酸代谢通路的富集,突显了芳香族氨基酸的累积,这与氮失衡以及肝性脑病等并发症相关[25]。 早在肝硬化发生前的慢性肝炎阶段,就可能出现支链氨基酸缺乏,这会导致白蛋白(Alb)合成减少、抗氧化能力下降,进一步加剧肝硬化的疾病进展[26]。支链氨基酸在改善免疫功能和减轻氧化应激方面发挥着重要作用[27],这表明针对性补充支链氨基酸可能有助于改善这些代谢紊乱。在这个阶段,肝脏的组织修复能力已不堪重负,进而导致纤维化进展[28]。 这些发现与先前报道的关联及已确立的病理机制一致。调节氨基酸代谢(如补充支链氨基酸或针对芳香族氨基酸失衡进行干预)可能有助于减轻氧化应激、改善免疫功能,并减缓肝纤维化的进展。
代谢异常会降低抗氧化能力并增加脂毒性,从而增加肝硬化的风险[29]。肝脂毒性以甘油三酯及其中间产物的异位蓄积为特征,会导致肝细胞损伤和肝脏内部结构改变[30, 31]。脂质超载会触发凋亡级联反应,随后激活半胱天冬酶,可能促进炎症和纤维化[32]。胆固醇结晶可激活NLRP3炎症小体,引发肝细胞炎症。在组织层面,会发生修复和重塑过程,进而导致纤维化。随着时间的推移,持续的脂质超载会诱发氧化应激,最终导致纤维化形成[33]。肝细胞特别容易受到以氧化应激为特征的“多重打击”,这会进一步促进促炎细胞因子的合成,推动疾病进展[34]。
视黄醇代谢[35]、磷脂酰肌醇磷酸代谢[36]和卟啉代谢[37]等通路的富集,突显了肝硬化中脂质代谢功能障碍的全身性特征。二十二碳六烯酸(DHA)水平升高虽通常具有抗炎作用,但在晚期肝病中可能反映出机体对慢性炎症的适应不良。同样,单不饱和脂肪酸(MUFAs)的减少以及大颗粒极低密度脂蛋白(VLDL)中总脂质的改变,凸显了脂质失衡会加剧肝细胞损伤[38]。脂质过氧化物以及受损肝细胞产生的产物会进一步激活肝星状细胞,促使其转化为肌成纤维细胞样细胞,并推动纤维化重塑[39]。这些发现强调了脂质代谢在肝硬化进展中的关键作用,并提示了潜在的治疗靶点。抗炎干预措施和恢复脂质平衡的策略可能减轻肝细胞损伤和纤维化,为肝硬化的管理提供了具有前景的途径。
在本研究中,我们考虑了多个重要因素,以减少潜在偏倚并提高结果的可靠性。首先,我们通过采用弹性网络正则化结合10折交叉验证的方法解决了变量选择偏倚问题,确保为模型所选的代谢物是肝硬化风险的稳健预测因子。关于英国生物银行数据中固有的健康志愿者偏倚(这可能导致数据中健康人群和老年人群的占比过高),我们承认这可能会限制研究结果对年轻人群或更多样化人群的普适性。不过,本研究结果仍提供了具有价值的见解,未来的研究应致力于在包含不同疾病严重程度和合并症的更广泛队列中验证这些模型,以更好地了解它们在实际临床环境中的适用性。
为解决数据不平衡问题,我们采用随机抽样的方法将数据集分为衍生队列(80%)和验证队列(20%),==未进行分层抽样。这种方法旨在保留样本中的异质性,从而提高模型的普适性。==此外,通过严格的数据处理和标准化,我们最大限度地减少了批次效应,以确保不同批次间代谢物浓度的可比性。在多重比较校正方面,我们应用了Benjamini-Hochberg方法对P值进行调整,降低了假阳性的可能性。这些策略增强了我们模型的稳健性,同时为未来临床验证的改进提供了清晰的框架。
我们开发了五个模型,结果显示APRI+代谢组学模型在肝硬化风险分层中表现最佳,具有很强的区分能力。基于质子核磁共振(¹H-NMR)的血清代谢组学分析不仅可靠,而且具有成本效益,仅通过一份血液样本就能提供全面的全身性代谢信息。本研究的优势在于样本量较大,且排除了已存在肝硬化的患者,从而最大限度地减少了与降脂治疗等相关的偏倚。 尽管本研究证明了¹H-NMR在识别肝硬化预测性代谢物方面的实用性,但必须承认该平台存在局限性。与质谱(MS)相比,¹H-NMR的灵敏度较低,可能无法捕捉到低丰度代谢物或复杂的化学结构[40]。不过,该平台的非破坏性、低样本制备要求以及可重复性使其非常适合大规模研究[41]。此外,在未来的分析中,将¹H-NMR数据与质谱数据相结合,可提供更广泛的代谢谱,提高预测模型的准确性和普适性。 尽管如此,我们承认排除使用降脂药物的个体可能引入了潜在偏倚。降脂药物会显著影响脂质代谢,进而影响代谢组学图谱。虽然排除这一群体可最大限度地减少混杂效应,但可能会限制研究结果对广泛人群的普适性,因为在这些人群中此类药物的使用较为普遍。未来的研究可纳入这些个体,并对降脂治疗的效果进行调整,以更好地评估其对肝硬化风险预测的影响。 本研究首次详细描述了利用代谢组学进行肝硬化风险分层的方法。我们使用已获得监管部门批准的成熟代谢组学平台,对基于疾病特异性的临床风险评分进行了验证。然而,其在临床应用中仍面临一些挑战。首先,众所周知,英国人群不能完全代表全球人群,因为本研究的参与者往往比普通人群年龄更大、更健康(即“健康志愿者”偏倚)。本研究的另一个局限性是缺乏肝脏弹性成像数据。
虽然我们验证了模型的内部有效性,但结果仍需在其他人群中进行外部验证,以增强其普适性。有必要在更广泛、更多样化的人群中进行外部验证,以评估模型的稳健性和普适性。现实世界的临床环境可通过整合不同种族、年龄组、合并症和疾病病因的数据而受益,从而为模型的实用性提供有价值的见解。
此外,整合来自质谱等平台的代谢组学数据可提供更全面的代谢谱,可能会提高模型在不同人群中的性能。 再者,血液样本是在非空腹状态下采集的,且在分析前储存了较长时间,这可能引入了一些变异,从而可能低估代谢组学模型的性能。空腹状态可能是代谢组学研究中的一个重要混杂因素,因为它会改变某些代谢物的水平,特别是与短期能量代谢相关的代谢物,如葡萄糖和酮体[42]。然而,先前的研究表明,许多关键代谢物,包括氨基酸、某些脂质和游离脂肪酸,受空腹的影响极小[43,44]。这支持了我们研究结果的稳健性,因为我们研究中确定的主要代谢物——游离脂肪酸和氨基酸——对因空腹状态引起的波动不太敏感。未来的研究应致力于通过标准化采样条件(包括记录样本采集时的空腹时间)来最大限度地减少变异性。比较空腹和非空腹状态下的代谢物水平将有助于评估变异性对模型性能的影响。此外,在具有严格空腹控制的独立队列中验证模型,可确保研究结果的稳健性和普适性。解决这些问题将使代谢组学研究能够更好地捕捉疾病特异性代谢特征,并提高预测模型的可靠性。
潜在的混杂因素,如饮酒量、药物使用和饮食习惯,也可能影响代谢组学图谱和肝硬化的进展。虽然在分析中对自我报告的饮酒量和药物使用数据进行了调整,但缺乏详细的饮食信息。这一局限性凸显了未来研究需要收集全面的生活方式和饮食数据,并进行敏感性分析,以评估它们对预测模型的影响。
最后,本研究中使用的代谢组学平台涵盖了广泛的脂质和脂质亚型,为进一步探索代谢物与肝硬化风险之间的关系提供了丰富的数据。
总之,我们已经证明,质子核磁共振(¹H-NMR)血清代谢组学可有效作为评估肝硬化风险的独立筛查工具。我们还表明,机器学习能够成功应用于减少风险预测所用的特征数量,同时保持较强的预测性能。在肝硬化研究中,几个大型代谢物聚类可由具有高预测价值的单个关键代谢物有效代表。这种方法在具有成本效益的应用方面展现出巨大潜力,这可能会促进其在临床实践中的采用。
不同技术的对比与应用场景
技术 | 灵敏度 | 适用代谢物类型 | 样品前处理 | 成本 | 典型应用场景 |
---|---|---|---|---|---|
¹H-NMR | 中(mmol-μmol) | 小分子、极性代谢物(如糖类、氨基酸) | 简单 | 中 | 大规模人群筛查、代谢轮廓快速分析 |
GC-MS | 高(nmol-pmol) | 挥发性、热稳定代谢物 | 复杂(衍生化) | 低 | 氨基酸、脂肪酸定量分析 |
LC-MS | 极高(pg-fg) | 非挥发性、热不稳定代谢物 | 中等 | 高 | 脂质组学、药物代谢物检测 |
CE-MS | 高 | 极性、离子型代谢物 | 简单 | 中 | 核苷酸、有机酸分析 |
MSI | 中 - 高 | 组织中所有可离子化代谢物 | 简单 | 极高 | 肿瘤组织代谢空间分布研究 |